智能论文笔记

Thai Wav2Vec2.0 with CommonVoice V8

Wannaphong Phatthiyaphaibun , Chompakorn Chaksangchaichot , Peerat Limkonchotiwat , Ekapol Chuangsuwanich , Sarana Nutanong

分类：自然语言处理

2022-08-09

最近，将音频转换为文本的系统自动语音识别（ASR）在机器学习社区中引起了很多关注。因此，Huggingface发布了许多公开模型。但是，这些ASR模型中的大多数都有英文提供。泰语中只有少数模型可用。此外，大多数泰国ASR型号都是封闭的，现有开源模型的性能缺乏稳健性。为了解决这个问题，我们使用泰语CommonVoice Corpus V8培训了一种新的ASR模型，并在预训练的XLSR-WAV2VEC模型上训练ASR模型，并训练Trigram语言模型以提高我们的ASR模型的性能。我们希望我们的模型对泰国的个人和ASR社区有益。

translated by 谷歌翻译

相关文章
笔记